Linguistische und semantische Annotation eines Zeitungskorpos

نویسندگان

  • Simon Clematide
  • Martin Volk
چکیده

Zusammenfassung. Dieser Artikel beschreibt das Vorgehen beim automatischen inkrementellen Aufbereiten eines rohen Textkorpus mit linguistischer und semantischer Information. Es wird gezeigt, wie das Erkennen von Eigennamen hilft, die Wortartenkategorisierung und partielle syntaktische Analysen zu verbessern. Eine Evaluation über ca. 1’000 Sätze zeigt die Stärken und Schwachpunkte der verschiedenen Erkenner auf.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Automatische Erzeugung Semantischer Annotationen für Vorlesungsvideos

Die Anzahl der aufgezeichneten digitalen Vorlesungen nimmt rapide zu. Immer mehr Hochschuleinrichtungen nutzen die Möglichkeit, ihre Vorlesungen als Videos aufzuzeichnen, in multimedialen Datenbanken abzulegen und für den Zugriff über das Internet bereitzustellen. Bislang ist die detaillierte Suche in diesen Multimedia Daten jedoch nur begrenzt möglich. Der Hauptgrund hierfür ist in dem Umstand...

متن کامل

Serengeti - Webbasierte Annotation semantischer Relationen

Der Artikel stellt zum einen ein Annotationsschema für semantische Relationen vor, das für die Beschreibung eines deutschsprachigen Korpus für Training und Evaluation eines Systems zur Anaphernauflösung entwickelt wurde, zum anderen wird das webbasierte Annotationstool Serengeti beschrieben, das zur Annotation anaphorischer Relationen im Projekt A „Sekimo“ eingesetzt wird. Im Gegensatz zu ande...

متن کامل

Extraktion vom Metadaten als Basis für eine semantische Integration heterogener Informationssysteme

Dieser Beitrag beschreibt einen Ansatz für die Extraktion von Metadaten als Basis für eine semantische Integration von heterogenen Informationssystemen. Es handelt sich dabei um einen Teilbereich eines Ansatzes für die semantische Integration von strukturierten und unstrukturierten Daten am Beispiel eines Data Warehouse und eines Wissensmanagementsystems. Ziel dieses Beitrags ist es zu zeigen, ...

متن کامل

Die semantische Gliederung als adäquate semantische Repräsentationsebene für einen sprachverstehenden 'Grafikeditor'

Zusammenfassung: In einem sprachverstehenden System soll der Bedeutungsinhalt einer gesprochenen Äußerung, die keinen Nebensatz enthält, mittels der semantischen Gliederung dargestellt werden. Diese setzt sich baumartig aus semantischen Untereinheiten (Semunen) zusammen. Sie ermöglicht es, innerhalb eines rein stochastischen ’Top-Down’-Ansatzes die Wahrscheinlichkeiten für die Emission von best...

متن کامل

Automatische Themenextraktion aus gesprochener Sprache

Bei vielen Formen der Kommunikation und Kooperation in Gruppensitzungen kann das Bereitstellen eines expliziten semantischen Kontextes wertvolle Unterstützung bieten. Semantische Kontexte können das gemeinsame Verständnis eines Problembereichs verbessern, die assoziative Ideenfindung unterstützen, eine moderierende Funktion in der Kommunikation übernehmen oder als Basis für Assistenzfunktionen ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2001